Détection de changements dans des flots de données qualitatives

نویسندگان

  • Dino Ienco
  • Albert Bifet
  • Bernhard Pfahringer
  • Pascal Poncelet
چکیده

Résumé. Pour mieux analyser et extraire de la connaissance de flots de données, des approches spécifiques ont été proposées ces dernières années. L’un des challenges auquel elles doivent faire face est la détection de changement dans les données. Alors que de plus en plus de données qualitatives sont générées, peu de travaux de recherche se sont intéressés à la détection de changement dans ce contexte et les travaux existants se sont principalement focalisés sur la qualité d’un modèle appris plutôt qu’au réel changement dans les données. Dans cet article nous proposons une nouvelle méthode de détection de changement non supervisée, appelée CDCStream (Change Detection in Categorical Data Streams), adaptée aux flux de données qualitatives.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Détection de changements de distribution dans un flux de données : une approche supervisée

Résumé. L’analyse de flux de données traite des données massives grâce à des algorithmes en ligne qui évitent le stockage exhaustif des données. La détection de changements dans la distribution d’un flux est une question importante dont les applications potentielles sont nombreuses. Dans cet article, la détection de changement est transposée en un problème d’apprentissage supervisé. Nous avons ...

متن کامل

Détection et Représentation des changements dans les sources de données RDF

Résumé : De nombreuses sources de données RDF sont en évolution constante que ce soit au niveau des données ou du vocabulaire utilisé (ontologie). De nombreuses tâches d’intégration sont impactées par ces modifications qu’il s’agisse de synchroniser des données locales avec une source de données externe ou d’effectuer des traitements plus complexes comme le liage ou la fusion de données. Dans c...

متن کامل

Investigation visuelle d'événements dans un grand flot de liens

Résumé. Nous présentons une nouvelle méthode d’analyse exploratoire de grands flots de liens que nous appliquons à la détection d’événements significatifs dans plus de 2 millions d’interactions (pendant 4 mois) entre utilisateurs du réseau social en ligne Github. Nous combinons une méthode statistique de détection automatique d’événements dans une série temporelle, Outskewer, avec un système de...

متن کامل

Apprentissage d'ensemble d'opérateurs de projection orthogonale pour la détection de nouveauté

Résumé. Dans ce papier, nous proposons une approche de détection de nouveauté fondée sur les opérateurs de projection orthogonale et l’idée de double bootstrap (bibootstrap). Notre approche appelée Random Subspace Novelty Detection Filter (RS-NDF), combine une technique de rééchantillonnage et l’idée d’apprentissage d’ensemble. RS-NDF est un ensemble de filtres NDF (Novelty Detection Filter), i...

متن کامل

Detection of change in river flow using phase randomization

Detection of nonstationarity in series of flow records is of vast scientific and practical significance. In order to develop guidance as to the choice of an appropriate test, among the many candidates, one has recourse to analysis of a controlled trend artificially introduced to generated data mimicking river flow observations. Raw series of good quality flow data were normalized and de-seasona...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2014